激熱!1日1製品!最強のデータ系SaaSはどれだ決定戦 アドベントカレンダー2021
時は2021年12月……。
日本での認知度の低さとは裏腹に……。
一際熱いSaaS業界がそこにはあった……!
本アドベントカレンダーの説明
「激熱!1日1製品!最強のデータ系SaaSはどれだ決定戦」アドベントカレンダーへようこそ!本企画は、今注目のデータ関連海外スタートアップのSaaS製品を1日1つ紹介していき、最終日に個人的に気に入った製品を5つピックアップする、DA事業本部春田による1人アドベントカレンダーです。
ここで言う「データ系SaaS」とは、「データ」に関係しているSaaS全般を指しています。一般的な用語がなさそうだったので、便宜上勝手に名付けました。一言で「データ系SaaS」と言っても、DWHやETL基盤、BIやリアルタイム分析、機械学習やマーケティングオートメーション、パイプラインやデータマネジメントといった、キリがないくらい様々な分野が存在しており、それを組み合わせて基盤をつくるモダンデータスタックという考え方が、データ基盤構築における最近のトレンドとなっています。つい先日、トレジャーデータ社@satoshihiroseさんの記事のバズりもあり、認知度が少し上がったように思えます。
さて、そんなモダンデータスタック界隈の中で、本アドベントカレンダーでは データマネジメント&ガバナンス に関するSaaSを集中的に取り扱っていく予定です。データマネジメント&ガバナンスという領域は、最近出てきた新しい概念というわけでもなく、DMBoK (Data Management Body of Knowledge)を筆頭に、2000年代から議論が重ねられてきた領域です。そして企業の扱うデータ量が膨張し、データ分析・利活用に関わる人数も増加している昨今の時代の流れから、データ基盤に対する管理と統制を重要視する企業が増えてきています。
ただし、その抽象度の高さや掴みどころのなさから、データマネジメント&ガバナンスのデファクトスタンダードは未だ定まっておらず、いわば未開の地となっています。だからこそ、多くのスタートアップが参入してくるわけですね。まさに群雄割拠、2020年代はデータ系SaaSの戦国時代です。
情報ソース
モダンデータスタック界隈の盛り上がり具合は、各所メディアやまとめサイトの多さからも伺えます。せっかくなので、本アドベントの情報ソースを掲載しておきます。興味がある方はこちらも見てみてください。
- Data Engineering Weekly - by Ananth Packkildurai
- The Data Engineering Podcast
- Modern Data Stack - Everything that you need to know !
- Open Source Data | DataStax
データ系SaaSの候補一覧
本アドベントカレンダーで取り扱うデータ系SaaSの候補を掲載します。ほぼ全て商用製品のため、スムーズにデモ環境が使えるかどうかが記事化の条件となってきます。23枠埋まり切らなかった場合は、クラウドベンダー製やOSSの製品でお茶を濁しておきますね。
- 5x | Convert your data into dollars
- Airbyte | Open-Source Data Integration Pipelines ELT
- Alation | Enterprise Data Catalog & Data Governance
- Alex Solutions | Enterprise Data Platform for workforce productivity
- Ataccama ONE | Turn your data into insights with free data profiling
- Atlan | Modern Data Workspace
- Bigeye | Data Observability
- Collibra | Helping Organizations Become United by Data
- Castor | Bring trust and visibility to your data
- ClicData | The Power of Your Data in Beautiful Dashboards
- Cyral | Governance and Protection - Secure your Data Mesh
- data.world | The Cloud-Native Data Catalog
- Datacoral | Maximize Data Pipeline Value, Minimize Data Engineering
- Dataedo | Single Source of Truth About Your Data
- Datafold | Data Reliability Platform
- Datakin | Data Lineage Solution
- DataGalaxy | The 360° Data Catalog for datagovernance
- Dreamdata | The Leading B2B Revenue Attribution Platform
- Egnyte | Mission Control for Critical Content
- erwin | Data Governance & Data Modeling
- Immuta | Universal Cloud Data Access Control
- Isima | 10x Data Engineer
- Iteratively | A single source of truth for your analytics
- Ketch | Programmatic Privacy Software
- Monte Carlo | Data Reliability Delivered
- Nexla | Unified Data Fabric for Modern Enterprises
- Ovaledge | A comprehensive data cataloging and governance solution
- Pinecone | Vector Database for Similarity Search
- Satori | Streamline data access and security with DataSecOps
- Secoda | Data discovery built for modern data teams
- Segment | #1 CDP to Manage Customer Data
- Select Star | Data discovery made easy
- Semarchy | Semarchy is the Intelligent Data Hub Company
- Soda Data Observability | Get ahead of silent data issues
- Stemma | Total Trust in Data
- strongDM | Connect Your Team to Anything
- TileDB | Data management made universal
- timbr SQL Knowledge Graph | Turning databases into knowledge graphs
- Tree Schema | The Human-Friendly Data Catalog
- Trifacta | Data Wrangling Software and Tools
- Upsolver | Continuous SQL Data Pipelines for Cloud Data Lakes
公開リスト
以下にブログのリンクを掲載しておきます。カテゴリは便宜上主観で分けています。
注意事項
つい煽り気味のタイトルをつけてしまいましたが、本企画では以下のことは実施しません。あくまでDevelopersIOらしい、いつも通りの「やってみた系」の記事を書いていきます。
- 製品に対する批判やネガティブなポイントの指摘
- スペックを表形式で比較するなど、製品どうしの直接的な比較
正直完走できるかどうかかなり不安ですが、乞うご期待ください!